iT邦幫忙

2023 iThome 鐵人賽

DAY 28
1
自我挑戰組

SRE 照書養系列 第 28

Day 28 - SRE 照書養:基礎建設服務的風險容忍度(下)

  • 分享至 

  • xImage
  •  

安安週四大家好!沒想到不知不覺就來到第二十八天,有小夥伴問我說會不會繼續把書讀完,是會的喔!這裡是今天讀的原文出處:Embracing Risk,那我們就開始吧!

關於「成本」,書中提出了一種有效地管理基礎設施服務的策略,這就是將基礎設施劃分為多個服務水平。承昨天的例子,以 Bigtable 為例,我們可以劃分為兩個集群:

  • 低延遲集群,初衷是為了提供更低延遲、更高可靠性的服務。
  • 高吞吐量集群,其冗餘度較低、利用率較高,達到將成本明顯降低的效果。

提供者將基礎設施分為多個服務水平,以此讓客戶能夠清晰地認識到各種風險和成本的取捨,根據需求來選擇合適的服務水平,實現成本效益的最優化。

書中提到 Google+ 將下面兩類數據分別存放在不同的數據存儲系統上:

  • 與用戶隱私相關的重要數據:一個全球複製式的類似於SQL 的系統,Spanner。
  • 非重要但對提升用戶體驗的數據:一個價格更低、可靠性更低和最終一致的數據存儲中(例如,Bigtable 這種僅僅提供「盡力而為」模式的複製模式的 NoSQL 存儲系統)。

此外,還提到我們可以通過調整服務的特性來提供不同水平的服務,比如:資源的數量、冗餘度、地理配置以及基礎設施軟體的配置等。

後記

今天看了跟「成本」有關的風險容忍度,了解到「管理基礎服務的關鍵是確定各類服務的風險容忍能力,並以此來調整不同系統的不可靠性」,接下來是「使用錯誤預算的目的」,那就明天見啦!掰噗!


上一篇
Day 27 - SRE 照書養:基礎建設服務的風險容忍度(上)
下一篇
Day 29 - SRE 照書養:使用錯誤預算的目的
系列文
SRE 照書養30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言